如何构建简单、智能又可靠的分支工厂 IT 基础设施?
分支工厂 IT 基础设施的现状与挑战
大中型制造业企业往往需要数个分布在不同城市甚至不同国家的工厂来完成制造任务,其中 MES 等制造业信息化系统作为驱动现代化制造的“大脑”已成为分支工厂的标配。然而,确保这些业务系统始终稳定运行并非易事。尤其是提供计算、存储和网络通信能力的 IT 基础设施,作为支持业务高效稳定运行的关键底座,一旦出现问题或将直接导致停机停产,给工厂业务带来重大损失。因此, IT 基础设施的建设和运维是整个分支工厂 IT 系统的重点。
然而,不同于总部的数据中心,分支工厂难以具备专业的运维团队和较快的问题处理速度,且由于分布分散、业务差异大,分支工厂在 IT 基础架构的运维管理上容易出现人手不足、专业技术匮乏、运维效率低、故障不能及时处理等问题。
同时,分支工厂的 IT 基础架构多采用“服务器(虚拟化)+ SAN 网络 + 独立 SAN 存储”的传统三层架构,这种架构为分支工厂的基础设施运维管理带来了更多挑战:
运维复杂:传统架构结构复杂,且运维中(如遇到硬盘和节点故障)涉及多项手动操作,运维难度大、风险高、时间长。
管理效率低:缺乏统一管理的工具和平台,需要运行多窗口对各工厂分别进行管理。
构建成本高:不仅需要购买存储硬件、专用的交换机和虚拟化软件,还需要占用较多机房空间。
制造业传统三层架构
SmartX 超融合基础设施如何解决这些挑战
SmartX 超融合以自主研发的分布式存储为核心,通过端到端的性能优化提升与多级别的数据保障,为分支工厂提供具备生产级高可靠高可用特性的基础架构,支持多地区工厂稳定开展包括核心业务在内的各类生产业务。
其中,SmartX 超融合自带多种数据保护和高可用机制,有效保证工厂核心业务连续性。
多副本机制不仅可以在服务器硬件故障时确保数据冗余不丢失、数据访问不中断,还可以利用已有空间自动完成数据的副本恢复,将数据恢复至正常状态。
虚拟机 HA 可为关键业务虚拟机开启“高可用”保护,当主机故障时,3 分钟内即可自动恢复业务,整个过程无需人工干预。
快照计划可根据用户设定的执行周期自动为虚拟机制作快照,在需要时快速恢复虚拟机,避免逻辑灾难。
对于有更高级别高可用需求的工厂,SmartX 可提供双活集群和跨站点异步复制等容灾方案,在发生机房等级别的故障时,仍可保障核心生产无中断。
扩容与软硬件升级“0”业务停机:SmartX 超融合架构支持软件一键升级功能,并可通过异构扩容和数据迁移实现硬件平滑升级,整个过程不停机,且几乎不涉及手动操作。
故障恢复与扩容空间均衡“0”人工干预:单节点故障后可自动恢复数据,并根据智能化的数据恢复与均衡算法自动平衡业务与数据恢复 I/O。同时,节点扩容后可自动均衡数据分布。
资源优化与日志采集等操作“1”键完成:虚拟机资源优化、日志采集等日常运维功能均可一键操作,大幅简化运维流程。
管理多集群与多数据中心仅需“1”套界面:统一视图界面实现集中管理,所有基础架构资源和状态一目了然,方便运维人员远程管理多厂区基础架构与业务系统。用户可使用 SmartX 管理平台 CloudTower 对各分支工厂的超融合集群进行统一纳管,并对虚拟机进行跨集群迁移、安全访问设置等操作,以获得更好的隔离性、可扩展性和可维护性。
相比于基于物理服务器的传统架构,超融合架构不需要独立的 SAN 交换机和独立的 SAN 存储,使得支持同样的业务所需的硬件数量不到传统架构(无虚拟化)的 1/6,机架空间节省 80% 以上,耗电量也大幅下降;即使是已经使用了服务器虚拟化的工厂,超融合也能节省掉独立的存储和服务器,提升机房的空间利用率超过 30%,同时降低机房在制冷、UPS 等方面的成本。
同时,如果用户采用 SmartX 原生虚拟化 ELF,还可节省 VMware 虚拟化采购成本。用户也可继续使用原有的 VMware 虚拟化授权,维持使用习惯。
某集团旗下有多个钢铁工厂,分布在全国各地,这些工厂不仅在地域上分布松散、偏远,而且缺乏专业的管理员执行运维工作——常驻运维人员少,且由于出差成本高,临时的运维人员也非常稀缺。同时,由于企业采用传统模式构建分支机构数据中心,面临硬件设备种类繁多、配置不灵活、架构复杂、性价比低等挑战。为了解决以上问题,该企业希望引进相较于传统架构更为简单、性能稳定、可承载分支工厂全部业务的新型架构。
经过产品评估和验证,该企业选择 SmartX 超融合作为部分地区新建工厂基础架构。在实际部署过程中,该企业选择软件交付的方式,可在多品牌服务器上部署。在服务硬件到位后,超融合系统在一周时间内部署上线完成,满足了新建工厂快速构建 IT 系统、业务上线的需求。
目前,该企业已在全国 5 个分支工厂部署 SmartX 超融合产品,每个工厂 4-6 个节点,承载包括 ERP、MES、工业网、设备管理、综合管理在内的全部生产业务,支持各分支工厂关键产线的稳定运行。
在运维方面,该企业位于总部的运维团队可以通过管理平台实现各地工厂的统一运维与管理;与此同时,为保障各地工厂的稳定运行,SmartX 售后工程师每周都会前往总部,针对各工厂的运行情况进行巡检,帮助分支工厂解决了运维统一性和专业性的问题。
某国际知名电子科技制造服务商计划使用私有云替代传统虚拟化架构,支持全球各分公司的信息化系统。同时,为保证生产安全,分公司的产线业务系统的基础架构必须做到严格的内网隔离,为内网的产线系统单独部署一套独立的基础架构,运行 MES、SAP、产线综合管理系统等产线业务系统。
目前基于其自主维护的 OpenStack + Ceph 的私有云方案(以下简称“原私有云方案”)架构复杂,实际部署过程中起步需要超过 20 个节点;而建设生产内网系统不仅构建成本高,也增加了运维的复杂性。
通过沟通,用户了解到 SmartX 超融合不仅架构精简、运维简单、弹性好,同时对双活和 Oracle RAC 有良好的支持能力,并已在业内具备诸多承载关键生产业务的案例,非常符合产线 IT 基础架构建设需求,于是决定进行产品 POC 评测。
历经超过半年的 POC 环节,SmartX 超融合在功能、稳定性等方面均满足了用户的要求,用户尤其满意 SmartX 超融合基于更精简的架构、更少的硬件却带来了更高的性能。用户基于同样的单节点配置对比了 7 节点原私有云方案和 3 节点 SmartX 超融合集群的性能,结果显示,在服务器节点减少超过一半的情况下,SmartX 超融合仍在 IOPS 和时延方面优于用户原私有云方案,远超出用户的预期。POC 的具体情况见下图。
降低采购与使用成本:所有超融合集群均采用 SmartX 超融合免费的原生虚拟化 ELF,在提供高可靠高可用特性的同时降低用户采购成本。
灵活配置:采用超融合软件交付的方式,用户可自行选择最有性价比的 x86 服务器硬件。
高效运维与统一管理:系统上线快、运维简单,用户也可在未来使用 CloudTower 对各地超融合集群进行统一的可视化管理。
推荐阅读:
点击阅读原文,了解更多 SmartX 行业客户超融合部署实战。